MILISY est un programme pédagogique devant servir d'introduction au probléme 


de la compréhension du langage naturel par ordinateur. 


TJ peut être une base pour l'étude de travaux plus développés dans le domaine. : 
p 1 | I I 


Tl a été écrit en LISP pour le PDP 10 de l'Université de Carnegie Mellon 


(Pittsburg-USA) par T. MORAN. 


Le programme à été adapté par P. GREUSSAY (Université Paris VIII) en LISP T1600 


à l'Institut de l'Environnement. 


Le déroulement da La conversation dans MILISY se passe de la manière suivante : 


1) lecture d'une phrase 

2) analyse syntaxique 

3) interprétation de sa signification 
4) action sur cette signification 


5) construction d'une réponse. 


D 


Le vocabulaire de base actuellement utilisé est le suivant (symboles terminaux) 


- deux formes du verbe être : IS ARE 


- quatre prépositions : IN ON UNDER NEAR 


- deux articles : A THE 


- deux adjectifs de taille : BIG SMALL 


- quatre adjectifs de couleur : RED BLUE GREEN BLACK 
~ cing noms d'objets : BOX BALL BLOCK TABLE FLOOR 


- deux pronoms interrogatifs : WHICH WHAT 


L'exemple qui suit présente une "conversation" avec MILISY 


? (CONVERSE) 
HELLO 


2(A BIG BOX IS ON A BLACK TABLE 
(OKAY) 
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Fig. 1 


solos 


? (WHAT IS BIG) 
(THE BIG BOX) 


? (WHAT IN ON TIE FLOOR) 
(THERE IS NO FLOOR) 


? (WHAT IS ON THE BOX) 
(NOTHING) 


? (A BALL IS ON THE TABLE) 
(OKAY) 


?(A BLOCK IS NOL ON "THE TABLE) 
(OKAY) 


? MIAT IS ON THE TABLE) 
CEHA BALL AND THE BIG BOX) 


?(THE BLUE BALL IS NEAR TIX BOX) 
(THERE IS NO BLUE BALL) 


? (IHE BALL IS BLUE) 
(OKAY) 


?(A BLACK BALL JS ON TIE TABLE) 
(OKAY) 


2CIS THERE THE BALL ON SHE TABLE) 
(L DONT KNOW BALL YOU MEAN) 


7(LS THE BLUE BALL ON TUE BLACK TABLE) 


(YES) 


? (HALT IS NOT NEAR THE BOX) 
(NO'P'ITTNG) 
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2 (WHAT TS ON THE TABLE) 
(I CANT PARSE YOUR INPUT) 


i 
2 (WHAT TS NOT ON THE TABLE) 
(THE BLOCK) 


2CIS TIE BLACK BOX ON TEE BLACK TABLE) 
(THERE IS NO BLACK BOX) 


?CES THE BLACK BOX ON THE FLOOR) 
(THERE IS NO BLACK BOX 


? (WHAT IS BLACK) 
(THE BLACK BALL AND THE BLACK TABLE) 


2BYE 
BYE 


MILISY, dans sa version de base accepte cing types de phrases. 
Phrases déclaratives : "sp" 
(A BLOCK LS NOT ON THE TABLE) 
Phrases existentielles : . "or" 
(THERE IS A BLUE BALL ON THE BLACK TABLE) 


Questions du type oui/non : "sq" 
(IS THE BLACK BOX ON THE FLOOR) 
Questions existentielles du type oui/non : "SEQ" 


(IS THERE TUE BLACK BOX ON THE TABLE) 
Questions du type quoi/quel : "sy" 


(WHAT IS ON THE TABLE) 


Cette grammaire initiale peut facilement être modifiée en changeant les règles 


existantes, ou en ajoutant de nouvelles régles. 


soso 
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Les régles de production utilisent une notation BNF (Backus Normal Form) 
modifiée : 

Un symbole nom-terminal est écrit entre crochets. 

Le % indique une classe de symboles terminaux. 

Entre deux symboles : le ! indique la disjonction 

en l'absence de ce signe la concaténation. 

Exemple : 

Watts Matt pte tty gon i war" US 

"ADI" :=%COLORIZS LEE 


= 


Une classe de svnboles terminaux se réécrit comme suit : 


ASTAESeEIGESMALL 


On passe de cette netation 4 la représentation interne LISP suivante : 


Chaque symbole non terminal correspond à un atome LISP ; les règles de produc~ 
tion sont des listes placées dans 1a p-liste de l'atome sous l'indicateur PRULE. 
Dans te cas où les régics de production définissent plusieurs réécritures pos- 
sibles, chaque réGeriiure constitue une sous-liste. Chaque classe de symboles 
terminaux correspond aussi à un atome LISP ; les éléments de la classe forment 


une liste placée dans la p-liste de l'atome sous l'indicateur SET. 


La figure 2 donne l'ensemble des régles de production. 


seal ees 
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CPRULE Cf OSS) Cenu) CS She) EESE? 


Hide < GTI 


CPRULE CE (Gebäi VPS) 99 


Hesse VPP 
CPRULE Cf (€e CEP» <PREDS235 


does < CMP oe 
t 


€PRULE C! 


t 


eR <P RIL 
ë Meet e D 
CPRULE CT CTHERE <CMP> «NP> &<PP223 12 


Reki < SAY 
» 
> 


CPRULE CF (ZBE <NP> <PRE> 2 32 


pss ST 
1 CDR THERE <NP> <PP>) >) 


` des < SWH > 
CPRULE Cf CAVU vtGüpx: <FRED>33) 


tacite CH u> 
CPRULE Ç! (NØT? NIG,3 $ 


Woo < PP > 


CPRULE C} CRPREP eNPr)553 
idee <] 122 


€PRULE Cf CADET <NPEr))3 
: Zei ph < NY $ > 


CPRULE CI (<MØDI> ENOUN <HDD2>))) 


Säck <1 @D ES . 
CPRULE C! C<ADJ> <MG0GDl>23 NIL)) 


Ask < ADJ > 


-CPRULE Cf C2C8LGR) CESIZE)D) 


seek <M D> 


CPRULE CI (<SWH>Y RELI) 


Se ste ate obs ae 
wise ZBE 


. {SET CIS ARED) 


ok BDD ED 


CSET CIN ON UNDER Mami? 


we SORT 


CSET CTHE A) 


wkk SST Z 
CSET CBIG SMALI Y 


fa sta le lenke Er E en 
Sege ech RO GL Biz 


CSET CRED BLUE fy LAC 


seats SA OLA 
CSET (DEOX BALI BLECH TABLE FL@GR23 
Asso SI 
CSET CVHICH WHAT? > 
MII I 
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LASER? J? 


. 


La premiére Grape apras la lecture d'une phrase en est l'analyse syntaxique : 
la fonction PARSE remplace la phrase initiale par l'arbre correspondant à sa 
structure syntaxique. 

Exemple : 

Pour la phrase TS THERE A BOX ON THE FLOOR, l'arbre suivant est produit : 


<§> 
<5EQ> 
ZEE Lo 
TRERE 
SR? 
GINN A 
<NP I> 
<MOD {> NIL 
ZNOUN BOX f : Fi ig. 3 
<MOD2> NIL 
<PP> 


ZPREP ON 
<NP> 
ADET THE 
<NP1> 
<MODI> NIL 
ANOUN FLOOR 
<MOD2> NIL 


C'est cet arbre qui va servir d'entrée à l'étape suivante dite d'"interprétation" ` 


et que nous allons voir plus en détail, 


1° Base de données : 


Chaque phrase entrée compléte (ou fait appel à) la connaissance par le programme 
d'un certain univers. Cet univers est décrit de manières interne par un ensemble 
de faits (FACTS) constituant la base de données du programme. La liste des faits 


a 


correspondant ñ la conversation ! est la suivante : 


Ly GE 
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Fig: 4 
(ON GO005 60002) A chaque nouvel objet introduit au cours 
(ZCOLOR GOQOS BLACK) de la conversation correspond un iden- 
(ISA G0005 BALL) tificateur : 
(%COLOR G0003 BLIN) GO001, G0002,... 
(NOT(ON G0004 GG002)) Un fait est généralement un triplet défi- 
(ISA G0004 BLOCK) uissant ou décrivant un objet 
(ON G0003 GO002) G0001 est une boite, G0001 est gros etc... 


(ISA C0003 BALL) 

(ON G0001 G0002) 
(ZCOLOR G0002 BLACK) 
(ISA G0002 TABLE) 
(ASTZE G0001 BIG) 
(LSA GO001 BOX) 


Chaque phrase après une interprétation, va être transformée en une action sur la 


base de données, 


o * 
2° Actions sur la base de données : 


Actuellement, 3 actions sont possibles sur la base de données. Elles se font par 


l'intermédiaire des 3 fonctions suivantes : 


D RECORD permet d'ajouter une information à la base de données. 

Par exemple, aprés une phrase du type (THE BALL IS BLUE), si 

HE BALL à comme identificateur interne G0003, la fonction RECORD 
ajoutera ä la base de données (ZCOLOR G0003 BLUE). 

permet de vérifier la présence d'une information dans la base de 
données. Aprés la phrase (IS THE BALL BLUE), la fonction VERIFY 
recherchera si l'on a (2COLOR G0003 BLUE) et répondra par OUI/NON. 


0 VERITY 


e 


E asa 
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O FIND permet de trouver s'ils existent, les objets ayant certaines 
propriétés. Par exemple, après la question (WHAT IS BLUE), la 
fonction FIND établira la liste des objets pouvant remplacer x 


duns (4COLOR x BLUE). 


3° Le mécauisme de l'interprétation. 


Tl va consister à substituer à la représentation sous forme d'arbre de la 
phrase un appel à l'une des 3 fonctions précédentes, avec les paramètres ` 
adéquats. Nous allons étudier ce mécanisme sur l'exemple de la phrase 

(IS THERE À BOX ON THE FLOOR) 
dont L'arbre syntaxique est donné Fig, 3. 
La phrase est do type "SEQ" ; elle aménera donc une réponse OUI/NON. Cette 
caractérisation du type de la phrase est remplacée par un appel de la fonc- 


tion VERIVY (Fig. 5). 


(APPLY 'I~SEQ) 


<S> 
VERIFY Pig. 5 
ss 
<NEG> NIL 


<NP > 
YDET A 
PIS ` 
<MOD1> NIL 
ZNOUN -BOX 
<MOD2> NIL 
<PRED> 
<pp> 


“PREP ON 
<NP> 
ADET TBE 
<NPI> 
“MOD I> NTL 
ANOUN FLOOR 
<MOD 2> NIL, 
n eee 
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A chaque groupe nominal (NP), correspond à un ou plusieurs objets représentés 


dans la base de données sous la forme G000n, L'analyse du groupe nominal (NP) 


va consister à chercher dans la base de données quels sont les objets qui lui 


sont associés. La Fig. 6 montre la recherche de la représentation interne de 


L'objet associé à "A BOX". 


CAPPLY TeNP 12 


RT & 

SNP> 

' 107 

emg bi> NIL 
cMfDer NIL 


“NP 


ISA 
107 
f BGA 
CAPPLY TeMGD&d 
<P> 
42DET À 
«NP 
107 
<pig@pe> NIL 
LSA 
107 
` BEK 
CAPPLY T=MGD25 
<N P> 
ADET A 
<NE Le 
107 
ISA 
107 
BOX 
CAPPLY TeNP3 
Kito 
A 
107 
ISA 
107 
BON 


CAPPLY T#JNDEF? 


Fig. 6 


La fonction (T-INDEF) va associer a la variable 
107 un objet (ici G0005) en recherchant dans la 
base de données les faits de la forme 


(ZISA 107 BOX). 
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CAPPLY TeN ETS 


<NP> 
SET ` JE 
<NPL>, Tig. 7 
I 106 
<an> NIL 
€MED2> NIL 
LSA 
108 
FL GT. 
€APPLY Teil Di 


po 
2DET TRE 
ch Pp i> 
10% 
aapa» NIL 
ISS 
108 
FLEUR 
CAPPLY Ten Gi 


<NP> 
RDET ` THE 
el i> 
Hais 
In 
108 
FLOGT 
CAPPLY Tepp? 


<i> 
THE 
106 
ISA 
r03 
. DT, GER 
CAPPLY TeDEF) 


ma Pa rs 


— 


G0004]N 11 


Le groupe <PRED> est soit une caractérisation d'un objet (ADJ), soit, et c'est 


le cag de l'exemple, une relation entre deux objets (PP). 


Le dernier groupe interprété est celui de la négation (Fig. 8). 


wid ware 
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| (APPLY "raf P) 


le Se rere Fig. 8 
VIEL EY ao 
SS 
«<NEG> NIL 
GN 
GO005 
60004 


CAPPLY TNN EM? 


< Sp 
VERT FY 
GN 
G0005 
GG6004 


La transformation finale de la phrase "IS THERE A BOX ON THE TABLE" est un appel 
de la fonction VERIFY avec comme argument (ON G0005 G0004). Après consultation 


de la base de données, la réponse sera OUI ou NON. 


MILISY est un programme simple et prétendant pas atteindre aux performances 
d'autres programmes dans le domaine (1). Certaines modifications (introduction 

de la possibilité de déduction) pourraient cependant lui permettre de travailler 
sur un univers complexe, 

Son intérêt principal est de montrer les problèmes de représentation d'un ensemble 
d'objets, de leurs caractéristiques, de leurs relations, par rapport à la compré- 
hension de phrases concernant cet ensemble d'objets. Il montre aussi les pos- 
sibilités offertes par le langage LISP en ce qui concerne la manipulation de 


telles descriptions. 
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